Text copied to clipboard!

Název

Text copied to clipboard!

Inženýr velkých dat

Popis

Text copied to clipboard!
Hledáme zkušeného Inženýra velkých dat, který se připojí k našemu technologickému týmu a pomůže nám navrhovat, implementovat a optimalizovat řešení pro zpracování a analýzu rozsáhlých datových sad. Tento odborník bude hrát klíčovou roli při vytváření robustní datové infrastruktury, která podporuje rozhodování na základě dat a umožňuje škálovatelné a efektivní zpracování dat v reálném čase i dávkově. Jako Inženýr velkých dat budete spolupracovat s datovými analytiky, vývojáři softwaru a dalšími členy týmu na vývoji datových toků, ETL procesů a integraci různorodých datových zdrojů. Budete pracovat s moderními technologiemi jako Apache Hadoop, Spark, Kafka, Hive, a dalšími nástroji pro zpracování dat. Vaším úkolem bude také zajištění kvality dat, bezpečnosti a souladu s předpisy. Ideální kandidát má hluboké znalosti v oblasti databází, distribuovaných systémů a programování, a zároveň rozumí principům datového modelování a optimalizace výkonu. Měl by být schopen řešit složité technické problémy, navrhovat efektivní architektury a přinášet inovativní řešení pro práci s daty. Tato pozice nabízí příležitost pracovat na zajímavých projektech v dynamickém prostředí, kde se klade důraz na neustálé zlepšování a technologický rozvoj. Pokud máte vášeň pro data, analytické myšlení a chuť učit se nové technologie, rádi vás přivítáme v našem týmu.

Odpovědnosti

Text copied to clipboard!
  • Návrh a implementace datových toků a ETL procesů
  • Správa a optimalizace distribuovaných datových systémů
  • Integrace různorodých datových zdrojů
  • Zajištění kvality, bezpečnosti a integrity dat
  • Spolupráce s datovými analytiky a vývojáři
  • Monitorování a ladění výkonu datových procesů
  • Vývoj automatizovaných nástrojů pro zpracování dat
  • Podpora rozhodování na základě dat
  • Tvorba technické dokumentace
  • Účast na návrhu datové architektury

Požadavky

Text copied to clipboard!
  • Vysokoškolské vzdělání v oboru informatiky, matematiky nebo příbuzném
  • Zkušenosti s technologiemi jako Hadoop, Spark, Kafka, Hive
  • Znalost SQL a programovacích jazyků jako Python, Java nebo Scala
  • Zkušenosti s návrhem a správou ETL procesů
  • Znalost principů distribuovaných systémů
  • Schopnost pracovat v týmu i samostatně
  • Analytické myšlení a schopnost řešit problémy
  • Zkušenosti s cloudovými platformami (např. AWS, Azure, GCP) výhodou
  • Znalost nástrojů pro správu verzí (např. Git)
  • Dobré komunikační schopnosti

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké technologie pro zpracování velkých dat ovládáte?
  • Popište projekt, na kterém jste pracoval s využitím Apache Spark.
  • Jak byste navrhl ETL proces pro integraci dat z více zdrojů?
  • Jak řešíte problémy s výkonem v distribuovaných systémech?
  • Jaké jsou vaše zkušenosti s cloudovými platformami?
  • Jak zajišťujete kvalitu a bezpečnost dat?
  • Jaké programovací jazyky používáte při práci s daty?
  • Jaké nástroje používáte pro monitorování datových toků?
  • Jak přistupujete k dokumentaci datových procesů?
  • Jaké jsou vaše zkušenosti s verzováním kódu?